La dimensión de salud mide que tan informados se encuentran las Medellinenses sobre los métodos de planificación familiar y que tanto hacen uso del sistema de salud de la ciudad.

Para la el análisis de la dimensión de SALUD en los barrios de Medellín se toman las siguientes preguntas con sus respectivos indicadores, estas preguntas son seleccionadas a la luz de descubrir si las condiciones de la dimensión aporta a la calidad de vida de los habitantes de los barrios de Medellín:

Posibles respuestas:

* 99    No responde
* 88    No aplica
* 1 Si
* 2 No

Indicador: Porcentaje de personas que consideran que tienen suficiente información sobre los métodos de planificación familiar

Fórmula: Cantidad de personas que consideran que tienen suficiente información sobre los métodos de planificación familiar / Total de personas encuestadas

Posibles respuestas:

* 99    No responde
* 88    No aplica
* 1 Si
* 2 No

Indicador: Porcentaje de personas que planifican (1)

Fórmula: Cantidad de personas que planifican / Total de personas encuestadas

Posibles respuestas:

* 99    No responde
* 88    No aplica
* 1 Si
* 2 No

Indicador: Porcentaje de personas que en los últimos 30 días han tenido algún problema de salud y no haya necesitado hospitalización (1)

Fórmula: Cantidad de personas que en los últimos 30 días han tenido algún problema de salud y no haya necesitado hospitalización / Total de personas encuestadas

Posibles respuestas:

* -99   No responde
* -98   No sabe.
* -88   No aplica
* -77   Otro
* 1 Consultó la Red de servicios de salud.
* 2 Acudió a una terapia alternativa.
* 3 Acudió a un boticario o farmaceuta
* 4 Consultó a un tegua, empírico, curandero, yerbatero, comadrona, etc.
* 5 Usó remedios caseros
* 6 Se automedicó
* 7 Nada

Para efectos del indicador se toma la opción 1. Consultó la Red de servicios de salud. para calcular el indicador, ya que esta opción mide que tanto uso se le da a la red.

Indicador: Porcentaje de personas que consultan a la red de servicios de salud cuando tienes problemas de salud

Fórmula: Cantidad de personas que consultan la red de servicios de salud / total de personas encuestadas

Posibles respuestas:

Indicador: Porcentaje de personas que no solicitaron o no recibieron atencion médica por mal servicio. Considerando mal servicio las opciones 5,6,7,8. Este indicador busca medir como persiven y que experiencia han tenido los hogares en este aspecto, el cual es vital para la calida de vida.

Fórmula: Cantidad de personas que no solicitaron atención médica o no la recibieron por mal servicio / total de personas encuestadas

Posibles respuestas:

Indicador: Porcentaje de personas que utilizan servicios de promocion y prevención.

Fórmula: Cantidad de personas que utilizaron los servicios de promoción y prevención / Total de persoans encuestadas

El insumo principal de este trabajo son los datos abiertos del portal Medata[1] y en particular la Encuesta de Calidad de Vida Medellín Cómo vamos.

1. Caracterización de las dimensiones para la dimensión VIVIENDA Y SERVICIOS PUBLICOS

Estadisticas básicas VIVIENDA Y SERVICIOS PUBLICOS

##            comuna             barrio        p_307            p_308       
##  EL POBLADO   : 22   SAN PABLO   :  3   Min.   :0.2500   Min.   :0.1068  
##  ROBLEDO      : 22   EL LLANO    :  2   1st Qu.:0.7282   1st Qu.:0.2406  
##  BELEN        : 21   EL SALADO   :  2   Median :0.7704   Median :0.2948  
##  SAN CRISTOBAL: 20   LA ESPERANZA:  2   Mean   :0.7642   Mean   :0.3045  
##  SAN JAVIER   : 19   LA FLORIDA  :  2   3rd Qu.:0.8102   3rd Qu.:0.3491  
##  VILLA HERMOSA: 18   LA PALMA    :  2   Max.   :1.0000   Max.   :1.0000  
##  (Other)      :185   (Other)     :294                    NA's   :5       
##      p_324             p_325             p_326             p_327         
##  Min.   :0.01786   Min.   :0.01786   Min.   :0.00112   Min.   :0.005831  
##  1st Qu.:0.11278   1st Qu.:0.08106   1st Qu.:0.00601   1st Qu.:0.096812  
##  Median :0.14472   Median :0.10895   Median :0.01078   Median :0.135198  
##  Mean   :0.15021   Mean   :0.11212   Mean   :0.01439   Mean   :0.141253  
##  3rd Qu.:0.18029   3rd Qu.:0.13523   3rd Qu.:0.01583   3rd Qu.:0.165094  
##  Max.   :0.57143   Max.   :0.30769   Max.   :0.19048   Max.   :0.500000  
##  NA's   :14        NA's   :17        NA's   :129       NA's   :14

Existen valores nulos dentro del dataframe, analizando cuales de ellos son debido a que no respondieron ninguna de las preguntas de la encuesta relacionadas a Salud, se encuentra que los nulos no son debido a que no quisieron responder la encuesta completa en temas de salud, sino que personas que no quisieron contestar alguna pregunta particular y por lo tanto las demás son insumo para el análisis.

##  [1] encuesta persona  comuna   barrio   estrato  p_15     p_307   
##  [8] p_308    p_324    p_325    p_326    p_327   
## <0 rows> (or 0-length row.names)

Para efectos de la ejecución de los modelos y demás anás, los valores del data frame ECV_SALUD_BARRIO que sean nulos se llenan con 0 dado que cuando se presenta un valor NAN significa que el indicador no aplica para el barrio y el cero lo representa

La matriz de correlación muestra la relación existente entre las preguntas p_324 y p_325, la cuales corresponden a ¿En los últimos 30 días, tuvo alguna enfermedad, accidente, problema odontológico, o algún otro problema de salud que no haya implicado hospitalización? y ¿Para tratar ese problema de salud, que hizo principalmente?, respectivamente.

2. Agrupamientos

Con aras de determinar si las preguntas seleccionadas en la dimensión aportan al futuro modelo de agrupamiento, se busca reducir las preguntas a aquellas que representen más en el análisis, esto se realiza a través del modelo de componentes principales (PCA)

De aquí los 2 primeros componentes se destacan antes de que haya una caída notable en la varianza

Ahora, revisemos cuales preguntas estan contribuyendo a cada uno de esos 2 componentes, seleccionando de cada componente las 6 preguntas contribuyentes

Seleccionamos las preguntas que contibuyan en más de un 20% en cada uno de los componentes, las cuales equivalen a las siguientes preguntas:

Con estas nueva selecció de preguntas, procederemos a realizar el agrupamiento

Si bien, la mayoria de los indicadores del dataframe ECV_SALUD_BARRIO se encuentran en función de personas para evitar cualquier dato erroneo por efectos de cambios en escala, se normalizan los datos

Se utilizan diferentes métodos para determinar el k óptimo a utilizar en el algoritmo de clusterización - Kmeans

Dado que para los diferentes métodos de determinación del k óptimo, hay dos posibles opciones, k =2 y k = 4, se ejecuta el algoritmo con estos posibles valores y se tomará aquel que ajuste mejor el modelo.

## [1] "Total SS k=2: "
## [1] 1.947243
## [1] "Total SS k=4: "
## [1] 3.704737

Con k = 4 el modelo ajuste mejor, hay cluster más heterogeneos, por lo tanto se toma éste como el número de k para el modelo

Según el algoritmo, se generaron 4 grupos distribuidos de la siguiente forma :

## # A tibble: 4 x 2
##   cluster barrios
##     <int>   <int>
## 1       1      11
## 2       2      88
## 3       3     125
## 4       4      79

Visualizando los grupos

Análisis para cada uno de los grupos

Grupo 1

##            comuna                 barrio      p_307       
##  PALMITAS     :3   BARRIO COLOMBIA   :1   Min.   :0.8000  
##  SAN CRISTOBAL:3   BARRO BLANCO      :1   1st Qu.:0.8735  
##  SANTA ELENA  :2   BATALLÓN GIRARDOT :1   Median :0.9138  
##  ALTAVISTA    :1   BOQUERÓN          :1   Mean   :0.9211  
##  EL POBLADO   :1   CABECERA ALTAVISTA:1   3rd Qu.:1.0000  
##  VILLA HERMOSA:1   LA ALDEA          :1   Max.   :1.0000  
##  (Other)      :0   (Other)           :5                   
##      p_308            p_324             p_325            cluster 
##  Min.   :0.4840   Min.   :0.00000   Min.   :0.00000   Min.   :1  
##  1st Qu.:0.5408   1st Qu.:0.00000   1st Qu.:0.00000   1st Qu.:1  
##  Median :0.5625   Median :0.09859   Median :0.09859   Median :1  
##  Mean   :0.6183   Mean   :0.13766   Mean   :0.09799   Mean   :1  
##  3rd Qu.:0.6137   3rd Qu.:0.16795   3rd Qu.:0.14834   3rd Qu.:1  
##  Max.   :1.0000   Max.   :0.57143   Max.   :0.30769   Max.   :1  
## 

El 92% de las personas encuestadas que pertenecen a este grupo tienen suficiente información sobre plnaificación familiar y el 61% en promedio planifican, el 13% de las personas se enfermaron en los últimos días antes de realizarle la encuenta.

Grupo 2

##               comuna                 barrio       p_307       
##  ARANJUEZ        :10   SAN PABLO        : 2   Min.   :0.6000  
##  LA CANDELARIA   :10   AGUAS FRÍAS      : 1   1st Qu.:0.7468  
##  VILLA HERMOSA   : 8   ALFONSO LÓPEZ    : 1   Median :0.7728  
##  SANTA CRUZ      : 7   ALTAVISTA CENTRAL: 1   Mean   :0.7734  
##  DOCE DE OCTUBRE : 6   ALTOS DEL POBLADO: 1   3rd Qu.:0.8063  
##  LAURELES-ESTADIO: 6   ANDALUCIA        : 1   Max.   :0.9395  
##  (Other)         :42   (Other)          :82                   
##      p_308            p_324            p_325            cluster 
##  Min.   :0.1466   Min.   :0.1220   Min.   :0.07879   Min.   :2  
##  1st Qu.:0.2266   1st Qu.:0.1690   1st Qu.:0.12009   1st Qu.:2  
##  Median :0.2648   Median :0.1905   Median :0.14286   Median :2  
##  Mean   :0.2622   Mean   :0.2020   Mean   :0.15030   Mean   :2  
##  3rd Qu.:0.2919   3rd Qu.:0.2215   3rd Qu.:0.16558   3rd Qu.:2  
##  Max.   :0.4157   Max.   :0.4810   Max.   :0.30556   Max.   :2  
## 

El 77% de las personas encuestadas que pertenecen a este grupo tienen suficiente información sobre plnaificación familiar y solo el 20% en promedio planifican, el 20% de las personas se enfermaron en los últimos días antes de realizarle la encuenta y el 15% buscaron la red de servicios de salud.

Grupo 3

##            comuna                    barrio        p_307       
##  ROBLEDO      :14   NARANJAL            :  2   Min.   :0.5631  
##  SAN JAVIER   :13   ALDEA PABLO VI      :  1   1st Qu.:0.7518  
##  CASTILLA     : 9   ALEJANDRO ECHAVARRÍA:  1   Median :0.7932  
##  EL POBLADO   : 9   ALTAMIRA            :  1   Mean   :0.7869  
##  MANRIQUE     : 9   ALTAVISTA           :  1   3rd Qu.:0.8221  
##  SAN CRISTOBAL: 9   ANTONIO NARIÑO      :  1   Max.   :0.9794  
##  (Other)      :63   (Other)             :119                   
##      p_308            p_324            p_325            cluster 
##  Min.   :0.2417   Min.   :0.0000   Min.   :0.00000   Min.   :3  
##  1st Qu.:0.3163   1st Qu.:0.1106   1st Qu.:0.07475   1st Qu.:3  
##  Median :0.3446   Median :0.1334   Median :0.09949   Median :3  
##  Mean   :0.3550   Mean   :0.1295   Mean   :0.09508   Mean   :3  
##  3rd Qu.:0.3822   3rd Qu.:0.1581   3rd Qu.:0.11556   3rd Qu.:3  
##  Max.   :0.5238   Max.   :0.2305   Max.   :0.22857   Max.   :3  
## 

El 78% de la población que respondió esta encuesta dice tener suficiente información sobre los métodos de planificación familiar y el 35% de ellos planifican. El último mes se enfermaron en promedio 12% de la poblaciún y el 9% asisitio a la red de salud.

Grupo 4

##               comuna                                   barrio  
##  BELEN           :13   EL LLANO                           : 2  
##  EL POBLADO      : 9   LA PALMA                           : 2  
##  LA AMERICA      : 8   ALEJANDRÍA                         : 1  
##  SAN CRISTOBAL   : 7   ÁREA DE EXPANSIÓN ALTAVISTA        : 1  
##  BUENOS AIRES    : 6   AREA EXPANSION SAN ANTONIO DE PRADO: 1  
##  LAURELES-ESTADIO: 6   BARRIO CRISTÓBAL                   : 1  
##  (Other)         :32   (Other)                            :73  
##      p_307            p_308            p_324             p_325        
##  Min.   :0.2500   Min.   :0.0000   Min.   :0.00000   Min.   :0.00000  
##  1st Qu.:0.6538   1st Qu.:0.1857   1st Qu.:0.06965   1st Qu.:0.04651  
##  Median :0.7140   Median :0.2236   Median :0.10617   Median :0.07884  
##  Mean   :0.6977   Mean   :0.2112   Mean   :0.10131   Mean   :0.07507  
##  3rd Qu.:0.7575   3rd Qu.:0.2541   3rd Qu.:0.13248   3rd Qu.:0.09677  
##  Max.   :1.0000   Max.   :0.3400   Max.   :0.22581   Max.   :0.18987  
##                                                                       
##     cluster 
##  Min.   :4  
##  1st Qu.:4  
##  Median :4  
##  Mean   :4  
##  3rd Qu.:4  
##  Max.   :4  
## 

El 69% de la población que respondió esta encuesta dice tener suficiente información sobre los métodos de planificación familiar y el 21% de ellos planifican. El último mes se enfermaron en promedio 10% de la poblaciún y el 7% asisitio a la red de salud.

Conozcamos algunos barrios que pertenecen a cada uno de estos grupos

## [1] "Grupo 1"
## [1] "CABECERA ALTAVISTA, BARRIO COLOMBIA, LA ALDEA, POTRERA MISERENGA, VOLCANA GUAYABAL, BOQUERÓN, LA ILUSIÓN, SAN JOSE DE LA MONTAÑA, BARRO BLANCO, MAZO, BATALLÓN GIRARDOT"
## [1] "Grupo 2"
## [1] "AGUAS FRÍAS, ALTAVISTA CENTRAL, ÁREA DE EXPANSIÓN BELÉN RINCÓN, SAN PABLO, ARANJUEZ, BASILIA, BERMEJAL- LOS ÁLAMOS, CAMPO VALDÉS Nº 1, LA PIÑUELA, LAS ESMERALDAS, MANRIQUE CENTRAL Nº 1, SAN ISIDRO, SAN PEDRO, SEVILLA, LA GLORIA, LAS MERCEDES, LOS ALPES, MIRAVALLE, SAN BERNARDO, LA ASOMADERA Nº 3, MIRA FLORES, OCHO DE MARZO, ALFONSO LÓPEZ, GIRARDOT, TEJELO, DOCE DE OCTUBRE Nº 2, EL TRIUNFO, LA ESPERANZA, PEDREGAL, PICACHO, PROGRESO  Nº 2, ALTOS DEL POBLADO, ASTORGA, MANILA, CRISTO REY, CALAZANS PARTE ALTA, EL DANUBIO, FERRINI, LA AMÉRICA, LA FLORESTA, BOMBONA Nº 1, BOSTON, CORAZÓN DE JESÚS, EL CHAGUALO, ESTACIÓN VILLA, JESÚS NAZARENO, LAS PALMAS, LOS ÁNGELES, SAN BENITO, VILLA NUEVA, BOLIVARIANA, CARLOS E RESTREPO, ESTADIO, LORENA, LOS COLORES, LOS CONQUISTADORES, CAMPO VALDES Nº 2, EL POMAR, MANRIQUE ORIENTAL, SAN JOSE LA CIMA Nº 2, SANTA INES, LA FRISOLA, URQUITA, GRANIZAL, MOSCU Nº 2, SAN PABLO, VILLA GUADALUPE, CÓRDOBA, LA PILARICA, OLAYA HERRERA, VILLA FLORA, LA CUCHILLA, BETANIA, EL SALADO, ANDALUCIA, EL PLAYON DE LOS COMUNEROS, LA FRANCIA, MOSCU Nº 1, PABLO VI, SANTA CRUZ, VILLA NIZA, ENCISO, LA MANSIÓN, LLANADITAS, LOS MANGOS, SUCRE, VILLA HERMOSA, VILLA LILIAM, VILLA TINA"
## [1] "Grupo 3"
## [1] "BUGA PATIO BONITO, EL JARDÍN, BERLÍN, MIRANDA, MORAVIA, PALERMO, ALTAVISTA, LA HONDONADA, LAS VIOLETAS, ALEJANDRO ECHAVARRÍA, BARRIO CAYCEDO, BARRIOS DE JESÚS, BOMBONA Nº 2, CATALUÑA, LA ASOMADERA Nº 2, LORETO, LOS CERROS EL VERJEL, BELALCAZAR, BOYACÁ, CASTILLA, FLORENCIA, HÉCTOR ABAD GÓMEZ, LAS BRISAS, PROGRESO, TOSCANA, TRICENTENARIO, MIRADOR DEL DOCE, PICACHITO, SAN MARTÍN DE PORRES, SANTANDER, CASTROPOL, EL CASTILLO, EL DIAMANTE Nº 2, EL TESORO, LAS LOMAS Nº 2, LOS BALSOS Nº 2, LOS NARANJOS, SAN LUCAS, VILLA CARLOTA, GUAYABAL, LA COLINA, SAN PABLO, BARRIO COLON, LA CANDELARIA, SAN DIEGO, LA CASTELLANA, NARANJAL, SURAMERICANA, EL RAIZAL, LA CRUZ, LA SALLE, LAS GRANJAS, MANRIQUE CENTRAL Nº 2, MARIA CANO - CARAMBOLAS, ORIENTE, SAN JOSELA CIMA Nº 1, VERSALLES Nº 2, LA SUIZA, SECTOR CENTRAL, ALDEA PABLO VI, CARPINELO, EL COMPROMISO, LA AVANZADA, LA ESPERANZA Nº 2, POPULAR, SANTO DOMINGO SABIO Nº 1, SANTO DOMINGO SABIO Nº 2, ALTAMIRA, AURES Nº 1, AURES Nº 2, BARRIO FACULTAD DE MINAS, BOSQUES DE SAN PABLO, CERRO EL VOLADOR, CUCARACHO, EL DIAMANTE, MONTECLARO, NUEVA VILLA DE LA IGUANA, PAJARITO, ROBLEDO, SAN GERMÁN, SANTA MARGARITA, CABECERA SAN ANT DE PR., EL SALADO, LA FLORIDA, MONTAÑITA, YARUMALITO, AREA DE EXPANCION SAN CRISTOBAL, AREA EXPANSION PAJARITO, CABECERA SAN CRISTÓBAL, CIUDADELA NUEVO OCCIDENTE, LA LOMA, LAS PLAYAS, NARANJAL, PEDREGAL ALTO, TRAVESÍAS, ANTONIO NARIÑO, BELENCITO, BLANQUIZAL, EDUARDO SANTOS, EL CORAZÓN, EL PESEBRE, EL SOCORRO / LA GABRIELA, JUAN XXIII - LA QUIEBRA, LA PRADERA, LAS INDEPENDENCIAS, METROPOLITANO, NUEVOS CONQUISTADORES, SANTA ROSA DE LIMA, LA FRONTERA, LA ISLA, LA ROSA, VILLA DEL SOCORRO, EL CERRO, LAS PALMAS, PIEDRA GORDA, PIEDRAS BLANCAS, SANTA ELENA SECTOR CENTRAL, EL PINAL, LA LADERA, LA LIBERTAD, LA SIERRA, LAS ESTANCIAS, SAN ANTONIO, SAN MIGUEL, TRECE DE NOVIEMBRE, VILLA TURBAY"
## [1] "Grupo 4"
## [1] ÁREA DE EXPANSIÓN ALTAVISTA EL CORAZÓN EL MORRO        
## [3] LA ESPERANZA                SAN JOSÉ DEL MANZANILLO    
## [5] BELÉN                       CERRO NUTIBARA             
## 299 Levels: AGUAS FRÍAS ALDEA PABLO VI ALEJANDRÍA ... YARUMALITO

Características que distinguen un grupo de barrios de otro

El grupo 1 se diferencia de los demás porque es el que en promedio dice tener suficiente información sobre los métodos de planificación familiar y son los que más planifican, el grupo 2 se identifica por ser los que en promedio en los últimos 30 dí se enfermaron sin necesidad de hospitalización y asistieron a la red de servicios de salud, el grupo 4 se caracteriza porque en promedio tiene menor aplicación en todos los indicadores de esta dimensión, por su parte el grupo 3 es un grupo cuyo compartamiento es intermedio.

3. Análisis espacial

Se cargan las subdivisiones territoriales de Medellín, tomadas de la página web de opendata[2]

## OGR data source with driver: ESRI Shapefile 
## Source: "/Users/yosel/Desktop/Especializacion/AprendizajeEstadistico/Agrupamiento/Taller 01/TAE_T1/dataSet/Barrio_Vereda/Barrio_Vereda.shp", layer: "Barrio_Vereda"
## with 332 features
## It has 6 fields
## Integer64 fields read as strings:  OBJECTID SUBTIPO_BA

Se procede a dibujar el mapa de Medellín señalando cada uno de los barrios a que cluster pertenece

Espacialmente vemos como la persepción de los Medellinenses a nivel de la dimensión SALUD no esta claramente sectorizada sino que varia de barrio en barrio sin importar la distancia entre ellos.

Referencias [1] Encuesta calidad de vida. http://medata.gov.co/dataset/encuesta-calidad-de-vida [2] Barrio Vereda. https://geomedellin-m-medellin.opendata.arcgis.com/datasets/c844f0fd764f41b2a808d8747457de8a_4